iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 23
0
Software Development

在AI的時代追求人性系列 第 23

機器學習中的人之議題(5):資料可視化的好與壞

  • 分享至 

  • xImage
  •  

上兩篇談了複雜模型的問題和XAI的介紹,
這篇我想要續談一個相關的主題:
資料可視化(Data Visualization)
(也有人翻作資料視覺化)

什麼是資料可視化呢?
要解釋資料可視化,
我們必須要從「可視化」這件事情先談起。

可視化,顧名思義就是把本來不是可見的東西,
變成肉眼可見的。

在可視化的領域裡,我們大致有三個有重疊的子領域:
資訊可視化(Information Visualization)、
科學可視化(Scientific Visualization)、
可視化分析(Visual Analytics)。

資訊可視化,指的是把抽象的資訊賦予可見的形狀,
讓本來不具有形體的資訊,能被人類的眼睛看見。
例如常見的長條圖,X軸常常是類別,
Y軸的高度對應到某一個屬性。
例如下面這張圖(圖片來源):
https://ithelp.ithome.com.tw/upload/images/20201007/20130709JevFpgCSjn.png
是在描述1/10~1/23時各國累積COVID-19的病例人數。
在這裡X軸對應的是日期,
Y軸對應的是病例數。
顏色則是對應到國家。
這三個資訊本身並不具有形狀,
是透過可視化的過程,
將這些視覺可以分辨的屬性,
對應到我們想要呈現的資訊。
在這個領域中,我們在研究的就是
怎麼樣有效率地選擇要呈現的資訊,
以及如何對應各種視覺屬性,
才能幫助人們吸收資訊。

科學視覺化則是在探討如何將資訊轉換回原本已經具有形狀的東西。
例如我們去做大腦電腦斷層掃描,收集到的掃描數據,
要如何建造出3D的大腦模型。

可視化分析則是在探討如何結合互動和可視化,
進行探索和分析。這個我下一篇可以再多談談。

資料可視化跟資訊可視化是非常類似的概念,
有時候會有人互用這兩個詞,
但如果真的要細分資料跟資訊的差異,
我會說,前者並不一定蘊含我們想要傳達的資訊。
資料本身可能只是數字、文字、圖片等等的東西,
他們要經過處理,才會成為資訊。

可視化之所以很好用,是因為人類的感官之中,
視覺是最靈敏,也是能夠處理最多資料量。
當我們把資訊有效地可視化的時候,
我們就可以很容易看見趨勢,
也更加容易理解。
像上面那張COVID-19的圖,
我們可以很明顯看到案例數隨著時間有大幅度的增長。
同樣的資訊如果只是用文字表達,
常常無法讓我們很快理解趨勢和差異。

然而視覺化並不總是好的。
在可視化中,我們有各種各樣的視覺屬性。
例如長度、位置、角度、顏色、大小、質地,
每一個都可以承載一種維度的資訊。
但當我們一次呈現過多資訊,
很常會讓資訊變得更加難理解。

而人類的眼睛對一些屬性的分辨度也比較差,
例如人類的眼睛並不擅長比較角度跟顏色。
因此如果拿角度或顏色去呈現連續的數值,
常常會變得很讓人困惑。
像是著名的圓餅圖:
https://ithelp.ithome.com.tw/upload/images/20201007/201307093ZbHzA5FfY.jpg
(圖片來源:https://commons.wikimedia.org/wiki/File:Pie-chart.jpg
就是在利用角度來表達連續性數值,
但如果大家仔細看一下隨處可見的圓餅圖,
就會發現圓餅圖幾乎都要加上文字標注實際數值,
而當數字接近時,我們常常無法真的去分辨哪一塊面積比較大。
這就是為什麼做可視化的人都會盡量避免使用圓餅圖來呈現資訊。

更不用說像Excel之類的工具,
有提供所謂的3D圖表。
3D圖表往往是中看不中用。
因為我們在螢幕上看到的3D實際上是2.5D,
他是扭曲過後的三個維度,
很多時候,相對資訊的呈現反而會讓人更容易誤會。

而在網路上大家也可能常常看到所謂的資訊圖(Inforgraphics),
很多都畫得很美,但往往卻為了美感,
或是為了刻意操作閱讀者的情緒,
誇大資訊的呈現。
(例如他們可能會用不精確的比例畫長條圖,
或是讓長條圖的數值軸不從0開始,
放大長條之間的差距)

有興趣多讀一些的人,可以參考這篇的介紹:
5 Ways Writers Use Misleading Graphs To Manipulate You [INFOGRAPHIC]

我自己博班的研究接觸很多可視化的東西,
最開始的時候,我想說,
可視化的東西不是拿Excel畫一畫就結束了嗎?
這到底還有什麼好研究的呢?

但經過了多年,時至今日,
我還是常常覺得,設計好的可視化是很難的。
比如說你說要怎麼樣把模型的解釋可視化?
只是畫畫長條圖就可以得到我們要的效果嗎?

答案其實都是:不一定。

可視化要用在互動的介面上,也是一門藝術。
下一篇我繼續談關於可視化分析,
並且想介紹可視化分析在機器學習領域的一些發展~


上一篇
機器學習中的人之議題(4):可以解釋的人工智慧?
下一篇
機器學習中的人之議題(6):可視化分析
系列文
在AI的時代追求人性30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言